El tratamiento de la polisemia en la extracción de léxicos bilinges a partir de corpora paralelos

نویسندگان

  • Pablo Gamallo
  • Susana Sotelo
چکیده

The paper proposes a method to extract translation equivalents from parallel corpora which were POS tagged and aligned using very large segments. The strategy we use takes into account the ability of contexts to select senses of words. Given a word of the source language and a particular type of context, we learn its word translation within an equivalent context.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

XTRA-Bi: Extracción automática de entidades bitextuales para software de traducción asistida

Resumen: El principal inconveniente de los sistemas de memorias de traducción es que para que lleguen a ser productivos requieren un costoso proceso previo de alimentación manual. XTRA-Bi desarrolla métodos de extracción y alimentación automática de segmentos bilingües a partir de corpora paralelos. La clave del método radica en la utilización del formato TMX para la importación de corpus previ...

متن کامل

Ampliación de WordNet mediante extracción léxica a partir de un diccionario de sinónimos

1. Introducción El objetivo del experimento presentado en este trabajo es la expansión del WordNet gallego mediante extracción léxica a partir de un diccionario de sinónimos de esta lengua. El experimento se realiza dentro del proyecto coordinado SKATeR en el que nuestro grupo tiene como objetivo prioritario la construcción de Galnet, la versión gallega del WordNet 3.0. El marco de desarrollo e...

متن کامل

Una Propuesta para el Etiquetado Automático de Roles Semánticos

Resumen: La identificación de los roles semánticos es una parte crucial en tareas que involucran tratamiento automático del lenguaje natural como la extracción y recuperación de información, sistemas de búsquedas de respuestas, generación de resúmenes, traducción automática, etc. Para el caso del español, la investigación en roles semánticos es escasa. El objetivo del actual trabajo es analizar...

متن کامل

Extracción de contextos definitorios en textos de especialidad a partir del reconocimiento de patrones lingüísticos

La extracción automática de definiciones a partir de textos de especialidad es una tarea cada vez más demandante para diferentes aplicaciones del Procesamiento de Lenguaje Natural, tales como lexicografía computacional, extracción de información, semántica computacional, sistemas preguntarespuesta, minería de textos, Web semántica y aprendizaje automático. Este artículo presenta un panorama de ...

متن کامل

ECPC: European Parliamentary Comparable and Parallel Corpora / Corpus comparables y paralelos de discursos parlamentarios europeos

El proyecto ECPC (European Parliamentary Comparable and Parallel Corpora) se enmarca dentro de los estudios traductológicos de corpus. La investigación se realiza partir de corpus comparables y paralelos, compuestos por discursos del Parlamento Europeo (EP/PE) así como de los parlamentos nacionales de España, Reino Unido e Irlanda. El grupo recibe financiación del Ministerio de Educación y Cien...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 35  شماره 

صفحات  -

تاریخ انتشار 2005